Ktoré AI modely si najviac vymýšľali? Výsledok vás prekvapí
Zdroj: Nano Banana Pro
2m čítanie

Ktoré AI modely si najviac vymýšľali? Výsledok vás prekvapí

AI modely si občas vymýšľajú, aj keď sa o tom teraz už veľmi nehovorí.

Halucinovanie je pojem, ktorým sa označuje odpovedanie nezávisle na tom, či je výstup pravdivý alebo nie. Textové nástroje umelej inteligencie sú totiž navrhnuté tak, aby vám vždy poskytli odpoveď.

Je až neuveriteľné, že bezplatné modely si vymýšľali menej ako tie platené.

Odpoveď by byť čo najpresnejšia, no vymýšľaniu sa niekedy nevyhne. Zákerné na tom je, že väčšina údajov bude pravdivá. Vymyslené môžu byť čísla, pojmy alebo niektoré faktické údaje. Zaujímavé je, že Grok-3, ktorý má byť najslobodnejší a podľa Elona Muska aj najlepší model na necenzurované AI, poskytoval najviac výmyslov.

Výsledky testu

AI ModelStupeň halucinovania
Perplexity37%
Copilot40%
Perplexity Pro45%
ChatGPT Search67%
Deepseek Search68%
Gemini76%
Grok-2 Search77%
Grok-3 Search94%

Zdroj: Columbia Journalism Review, Marec 2025.

Rátať ešte nevedia

Na webe Visual Capitalist sa objavil rebríček toho, ako si jednotlivé nástroje vymýšľajú – halucinujú. V týchto prípadoch nejde o zlú interpretáciu údajov, ktoré sú vytiahnuté z webových stránok. Okrem toho AI modely vo všeobecnosti zatiaľ nie sú vhodné na matematické úlohy – tu sa môžete stretnúť s rôznou interpretáciou odpovede. Vo veľkom záleží aj to, akým spôsobom sa pýtate.

AI modely a novinové články

Test, ktorý odhalil halucinácie, prebehol na základe krátkych úryvkov z novinových článkov. AI modely mali určiť jeho pôvod, názov a zobraziť aj zdrojovú adresu. Úryvky boli vybrané tak, aby bolo jednoduché ich nájsť cez vyhľadávanie na Googli. To by zvládol aj človek, preto je až zarážajúce, ako veľmi si jednotlivé nástroje vymýšľali.

Stále však platí, že nástroje si zvyknú vymýšľať rôzne zdroje, ktoré buď danú správu nepotvrdia alebo ju vôbec nepublikovali. Najlepším spôsobom je požiadať AI, aby vám zobrazila zdroj, odkiaľ čerpala informácie. Na tomto si svoj AI model založili aj v Perplexity. Postupne sa k tomu pridali aj ostatní výrobcovia AI. Tiež uvádzajú zdroje pri takmer každej odpovedi.

Columbia Journalism Review halucination test march 2025
Zdroj: Columbia Journalism Review halucination

Zdroj: Visual Capitalist, Columbia Journalism Review

Prečítajte si aj: